多腕バンディット問題のアルゴリズムを用いた大貧民AI

1. NAISTスプリングセミナー2017  多腕バンディット問題とは？  強化学習の一手法  当たりの出る確率が未知のスロットを引き続けて、報酬を最大に  トランプゲームの大貧民（大富豪）をプレイする AI（人工知能）の作り方を学習！  多腕バンディット問題を用いて強い AI を作成  機械学習の知識は不要です。  使用プログラミング言語は任意です。受講生のスキルに応じた実習内容です。多腕バンディット問題のアルゴリズムを用いた大貧民AI 大規模システム管理研究室 http://www-lsm.naist.jp 多腕バンディット問題ゲーム木探索